با توجه به داده بانک جهانی به سوالات زیر پاسخ دهید. برای استفاده از داده از سه فایل زیر استفاده نمایید. داده نام کشورها: WDICountry داده نام سری های زمانی: WDISeries داده کل: WDIData در صورتی که داده را در اختیار ندارید می توانید از بسته WDI استفاده نموده و داده های مورد نظر را استخراج نمایید.
۱. ده کشور فقیر دنیا را بیابید. نمودار درآمد روزانه آنها را رسم کنید. چند درصد از اعضای این کشورها زیر خط فقر هستند؟ متوسط عمر در این کشورها چقدر است؟
بیست کشور فقیر بر اساس میانگین ۷ سال اخیر
## [1] "Congo, Dem. Rep." "Madagascar"
## [3] "Burundi" "Malawi"
## [5] "Guinea-Bissau" "Mozambique"
## [7] "Rwanda" "Sierra Leone"
## [9] "Niger" "Tanzania"
## [11] "Lesotho" "Zambia"
## [13] "Benin" "Burkina Faso"
## [15] "Low income" "Togo"
## [17] "Liberia" "Timor-Leste"
## [19] "Guinea" "Sao Tome and Principe"
درآمد روزانه کشورهای فقیر در یک خانواده بر اساس ۷ سال اخیر
## # A tibble: 7 x 2
## `Country Name` mean
## <chr> <dbl>
## 1 Benin 2.71
## 2 Burkina Faso 2.76
## 3 Madagascar 1.56
## 4 Mozambique 2.64
## 5 Rwanda 2.76
## 6 Togo 2.67
## 7 Zambia 2.79
متوسط عمر در کشورهای فقیر بر اساس ۷ سال اخیر
## # A tibble: 10 x 2
## `Country Name` mean
## <chr> <dbl>
## 1 Burundi 56.2
## 2 Congo, Dem. Rep. 58.3
## 3 Guinea-Bissau 56.2
## 4 Madagascar 64.7
## 5 Malawi 60.7
## 6 Mozambique 56.5
## 7 Niger 58.6
## 8 Rwanda 65.4
## 9 Sierra Leone 50.2
## 10 Tanzania 63.3
۲. تراژدی روآندا: بر اساس داده های امید به زندگی ابتدا نمودار سالانه نمودار جعبه ایی امید به زندگی کشورها را رسم نمایید(در یک نمودار!). سپس سری زمانی امید به زندگی روآندا را به آن اضافه کنید. چه می بینید؟ چند میلیون نفر کشته شدند؟
حدود یک میلیون نفر در روآندا کشته شدند. (در یک سال) کاهش امید به زندگی هم به این علت است. (خط بنفش روآندا را نشان میدهد)
۳. نمودار امید به زندگی و هزینه های بهداشتی را رسم کنید. چه نتیجه ایی می گیرید؟
با بالا رفتن بهداشت و هزینه های بهداشتی، میانگین عمر هم زیاد میشود.
۴. آیا قدرت خرید خانواده های ایرانی در ۵۰ سال اخیر افزایش یافته است؟ برای این کار از داده های اقتصادی خانوار استفاده کنید.
بله. تست فرض نیز تغییر میانگین را تایید میکند.
library(WDI)
library(readr)
data = read_csv("~/Downloads/WDI_csv/WDIData.csv")
p = WDIsearch(string = "consumption", cache = NULL)
data %>% filter(`Indicator Code` == "NE.CON.PRVT.CD") ->h
h %>% filter(`Country Name` == "Iran, Islamic Rep.") -> h
h %>% select_if(~sum(!is.na(.)) > 0) ->h
chisq.test(h[5:60])##
## Chi-squared test for given probabilities
##
## data: h[5:60]
## X-squared = 3.8255e+12, df = 55, p-value < 2.2e-16
h = h[5:60]
h = t(h)
h = as.data.frame(h)
h <- add_rownames(h, "year")
colnames(h) = c("year", "value")
ggplot(h, aes(x = year, y = value)) + geom_point() + theme(axis.text.x = element_text(angle=-90, vjust=0.5))۵. رشد اقتصادی ایران را با کشورهای دیگر در طول ۲۰ سال گذشته بر حسب بیست شاخص های اقتصادی مهم مانند تولید ناخالص ملی، تورم و … ارزیابی کنید! (برای هر شاخص از تصویرسازی استفاده کنید.)
شاخصهای اقتصادی و مقایسه ایران با میانگین بقیه جهان. (به دلیل موجود نبودن تعداد زیادی از شاخصها از ۱۱ شاخص استفاده شده است.)
شاخصهای بهداشتی و مقایسه ایران با میانگین بقیه جهان.
شاخصهای آموزشی و مقایسه ایران با میانگین بقیه جهان.
۶. در قسمت قبل با استفاده از روش خوشه بندی k-means داده ها را به سه دسته تقسیم کنید. ایران در کدام دسته می گنجد؟ (پیش از خوشه بندی طبیعتا داده را باید پاکسازی و استاندارد سازی نمایید.)
دادههای اقتصادی
## # A tibble: 87 x 2
## `Country Name` cluster
## <chr> <int>
## 1 Afghanistan 3
## 2 Albania 3
## 3 Algeria 3
## 4 Angola 3
## 5 Argentina 3
## 6 Armenia 3
## 7 Azerbaijan 3
## 8 Bangladesh 3
## 9 Belarus 3
## 10 Belize 3
## 11 Benin 3
## 12 Bhutan 3
## 13 Bolivia 3
## 14 Bosnia and Herzegovina 3
## 15 Botswana 3
## 16 Brazil 3
## 17 Bulgaria 3
## 18 Burkina Faso 3
## 19 Burundi 3
## 20 Cabo Verde 3
## 21 Cambodia 3
## 22 Central African Republic 3
## 23 Colombia 3
## 24 Congo, Dem. Rep. 3
## 25 Congo, Rep. 3
## 26 Costa Rica 3
## 27 Cote d'Ivoire 3
## 28 Dominican Republic 3
## 29 Egypt, Arab Rep. 3
## 30 El Salvador 3
## 31 Ethiopia 3
## 32 Gambia, The 3
## 33 Georgia 3
## 34 Ghana 3
## 35 Guatemala 3
## 36 Honduras 3
## 37 India 3
## 38 Indonesia 2
## 39 Iran, Islamic Rep. 2
## 40 Jamaica 3
## 41 Jordan 3
## 42 Kazakhstan 3
## 43 Kenya 3
## 44 Kyrgyz Republic 3
## 45 Lao PDR 3
## 46 Lebanon 3
## 47 Lesotho 3
## 48 Liberia 3
## 49 Macedonia, FYR 3
## 50 Madagascar 3
## 51 Malawi 3
## 52 Malaysia 3
## 53 Mali 3
## 54 Mauritius 3
## 55 Mexico 3
## 56 Moldova 3
## 57 Mongolia 3
## 58 Morocco 3
## 59 Mozambique 3
## 60 Nepal 3
## 61 Nicaragua 3
## 62 Nigeria 3
## 63 Pakistan 3
## 64 Papua New Guinea 3
## 65 Paraguay 3
## 66 Peru 3
## 67 Philippines 3
## 68 Romania 3
## 69 Russian Federation 3
## 70 Rwanda 3
## 71 Senegal 3
## 72 Serbia 3
## 73 Sierra Leone 3
## 74 South Africa 3
## 75 Sri Lanka 3
## 76 Swaziland 3
## 77 Syrian Arab Republic 3
## 78 Tanzania 3
## 79 Thailand 3
## 80 Togo 3
## 81 Tunisia 3
## 82 Turkey 3
## 83 Uganda 3
## 84 Ukraine 3
## 85 Vanuatu 3
## 86 Vietnam 1
## 87 Zimbabwe 3
دادههای آموزشی
## # A tibble: 95 x 2
## `Country Name` cluster
## <chr> <int>
## 1 Albania 3
## 2 Algeria 3
## 3 Argentina 3
## 4 Armenia 3
## 5 Bahrain 3
## 6 Benin 3
## 7 Bhutan 3
## 8 Botswana 3
## 9 Brunei Darussalam 3
## 10 Bulgaria 3
## 11 Burkina Faso 3
## 12 Burundi 3
## 13 Cabo Verde 3
## 14 Cambodia 3
## 15 Cameroon 3
## 16 Central African Republic 3
## 17 Chad 3
## 18 Chile 3
## 19 Colombia 1
## 20 Comoros 3
## 21 Congo, Dem. Rep. 1
## 22 Congo, Rep. 3
## 23 Cote d'Ivoire 3
## 24 Cuba 3
## 25 Cyprus 3
## 26 Dominican Republic 3
## 27 Ecuador 3
## 28 El Salvador 3
## 29 Eritrea 3
## 30 Estonia 3
## 31 Ethiopia 1
## 32 Gambia, The 3
## 33 Georgia 3
## 34 Ghana 3
## 35 Guatemala 3
## 36 Guinea 3
## 37 Guyana 3
## 38 Honduras 3
## 39 India 2
## 40 Indonesia 1
## 41 Iran, Islamic Rep. 1
## 42 Italy 1
## 43 Jamaica 3
## 44 Jordan 3
## 45 Kazakhstan 3
## 46 Kuwait 3
## 47 Lao PDR 3
## 48 Latvia 3
## 49 Lesotho 3
## 50 Lithuania 3
## 51 Macao SAR, China 3
## 52 Madagascar 3
## 53 Malawi 3
## 54 Malaysia 3
## 55 Mali 3
## 56 Malta 3
## 57 Mauritania 3
## 58 Mauritius 3
## 59 Mexico 1
## 60 Moldova 3
## 61 Mongolia 3
## 62 Morocco 3
## 63 Mozambique 3
## 64 Namibia 3
## 65 Nepal 3
## 66 Nicaragua 3
## 67 Niger 3
## 68 Oman 3
## 69 Pakistan 1
## 70 Panama 3
## 71 Peru 3
## 72 Philippines 1
## 73 Puerto Rico 3
## 74 Qatar 3
## 75 Romania 3
## 76 Rwanda 3
## 77 Samoa 3
## 78 Sao Tome and Principe 3
## 79 Saudi Arabia 3
## 80 Senegal 3
## 81 Serbia 3
## 82 Sierra Leone 3
## 83 Spain 1
## 84 Swaziland 3
## 85 Syrian Arab Republic 3
## 86 Tanzania 3
## 87 Thailand 1
## 88 Togo 3
## 89 Tunisia 3
## 90 Turkey 1
## 91 Ukraine 1
## 92 United Arab Emirates 3
## 93 Uruguay 3
## 94 Venezuela, RB 3
## 95 Zimbabwe 3
دادههای سلامت
## # A tibble: 59 x 2
## `Country Name` cluster
## <chr> <int>
## 1 Latin America & Caribbean 2
## 2 Latin America & Caribbean (excluding high income) 2
## 3 Albania 1
## 4 Argentina 3
## 5 Armenia 1
## 6 Australia 2
## 7 Azerbaijan 1
## 8 Barbados 1
## 9 Belarus 1
## 10 Belize 1
## 11 Brazil 1
## 12 Colombia 1
## 13 Costa Rica 1
## 14 Cuba 1
## 15 Dominican Republic 1
## 16 Ecuador 1
## 17 Egypt, Arab Rep. 1
## 18 El Salvador 1
## 19 France 2
## 20 Georgia 1
## 21 Guatemala 1
## 22 Guyana 1
## 23 Haiti 1
## 24 Honduras 1
## 25 India 2
## 26 Iran, Islamic Rep. 3
## 27 Ireland 1
## 28 Italy 2
## 29 Jamaica 1
## 30 Jordan 3
## 31 Kazakhstan 3
## 32 Kyrgyz Republic 1
## 33 Latvia 1
## 34 Lithuania 1
## 35 Macedonia, FYR 1
## 36 Malta 1
## 37 Mexico 1
## 38 Moldova 1
## 39 Mongolia 1
## 40 Montenegro 1
## 41 Morocco 1
## 42 Nicaragua 1
## 43 Panama 1
## 44 Paraguay 1
## 45 Peru 1
## 46 Philippines 1
## 47 Serbia 1
## 48 Slovak Republic 1
## 49 Slovenia 1
## 50 South Africa 3
## 51 Sri Lanka 1
## 52 Suriname 1
## 53 Tajikistan 1
## 54 Thailand 3
## 55 Trinidad and Tobago 1
## 56 Tunisia 1
## 57 Ukraine 2
## 58 Uruguay 1
## 59 Venezuela, RB 1
۷. به وسیله تحلیل مولفه اصلی بعد داده رو به دو کاهش دهید سپس خوشه های به دست آمده در قسمت قبل را بر روی آن نمایش دهید. آیا عملکرد روش خوشه بندی شما مطلوب بوده است؟
داده های اقتصادی
داده های آموزشی
داده های سلامت
همان طور که مشاهده میشود داده ها به خوبی از هم جدا هستند و این کاهش بسیار مناسب بوده است.
۸. با استفاده از داده روشی برای پیش بینی رشد اقتصادی ایران در سال آینده ارائه دهید.
library(WDI)
library(readr)
library(dplyr)
library(tidyr)
data = read_csv("~/Downloads/WDI_csv/WDIData.csv")
data %>% filter(`Indicator Code` == "GC.XPN.TOTL.GD.ZS") ->gdp
gdp %>% filter(`Country Code` == "IRN") -> irn
irn = irn[17:53]
irn = t(irn)
irn = as.data.frame(irn)
irn <- add_rownames(irn, "year")
fit = lm(data = irn, V1 ~ year)
fit##
## Call:
## lm(formula = V1 ~ year, data = irn)
##
## Coefficients:
## (Intercept) year1973 year1974 year1975 year1976
## 20.76383 -2.29099 12.30933 13.30733 8.65737
## year1977 year1978 year1979 year1980 year1981
## 7.19874 8.51400 5.13263 6.59189 6.41499
## year1982 year1983 year1984 year1985 year1986
## 2.23595 -0.44479 -2.21762 -2.42191 -3.32120
## year1987 year1988 year1989 year1990 year1991
## -3.94765 -2.41457 -5.76797 -6.09653 -7.55951
## year1992 year1993 year1994 year1995 year1996
## -6.87178 -5.93246 -5.22548 -5.88671 -5.15335
## year1997 year1998 year1999 year2000 year2001
## -4.84251 -2.59599 -4.18306 -5.17321 -3.21750
## year2002 year2003 year2004 year2005 year2006
## -3.27793 -3.58830 -4.11092 -1.34359 -0.04595
## year2007 year2008
## -3.93806 -2.51282
۹. سوالهای ۵ تا ۷ را ابتدا برای ۲۰ شاخص سلامت سپس بر حسب ۲۰ شاخص آموزشی تکرار کنید.
۱۰. کشورهای دنیا را بر حسب ۶۰ شاخص اقتصادی، سلامت و آموزش با روش سلسله مراتبی خوشه بندی کرده و دندروگرام آن را رسم نمایید. اگر داده ها بر سه دسته تقسیم شوند ایران در کدام دسته می گنجد؟
۱۱. سه یافته جالب از داده ها استخراج کنید.
مقایسه تجارت سه کشور ابر قدرت
مقایسه طول عمر سه کشور ابر قدرت
مصرف برق کشورهای مختلف (ایران جز کشورهای کم مصرف به حساب میاید)